通过整合组学研究发现与肝癌发生发展相关的长非编码RNA

通过整合组学研究发现与肝癌发生发展相关的长非编码RNA

作者:师大云端图书馆 时间:2015-06-21 分类:开题报告 喜欢:1950
师大云端图书馆

【摘要】肝细胞癌(Hepatocellularcarcinoma,HCC)是世界范围内最常见的人类癌症之一。我国每年新发及死亡HCC病例约占全世界病例的一半以上。在我国,HCC患者中约80%是乙型肝炎病毒(HepatitisBvirus,HBV)携带者。尽管医疗水平不断提高,HBV相关HCC患者的5年生存率仍然很低。发现和鉴定肝癌的致病基因,研究其与肝癌发生和发展之间的关系,不仅有助于阐明肝癌形成的机制,而且对于肝癌新的预防、诊断、治疗措施的研发都具有极为重要的意义。长非编码RNA(Longnon-codingRNA,lncRNA)是指长度超过200个核苷酸的非编码RNA。与其它的非编码RNA(如microRNA)相比,lncRNA具有更长的序列与更复杂的二级结构和三级结构。众多已有研究表明,lncRNA不仅在细胞周期、凋亡和分化等基本的细胞生物学过程中发挥调控功能,在癌症等疾病的发生发展过程中也发挥着重要作用。在癌症中,lncRNA的转录水平异常往往可以标志着疾病的进展程度,甚至可以用来预测个体的患病风险。本课题的目标就是要通过“组学”技术以及生物信息学分析方法,系统发现和鉴定与肝癌发生发展相关的lncRNAs,为将来lncRNAs在肝癌中的作用和分子机制研究,以及基于lncRNAs的应用研究奠定基础。为此,我们收集了40例HCC患者的癌组织及其配对的癌旁组织样本,采用AffymetrixExon1.0ST芯片与ArrayStarHuman12x135kLongNon-codingRNAArray两种芯片,分别对这40对HCC样本的编码基因(mRNA)与lncRNA的转录水平进行了高通量检测,然后通过“整合组学”分析方法,整合分析编码基因表达谱和lncRNA表达谱数据,期望以此发现与肝癌发生发展相关的lncRNAs。首先,我们采用RMA(Robustmulti-arrayaverage)的方法对上述编码基因表达谱和lncRNA表达谱数据进行了预处理。通过对样本与表达谱数据的一系列质量控制,我们最终获得了包括76个样本、11,221个编码基因的表达谱数据与包括75个样本、23,726个lncRNA的表达谱数据。我们通过SVA(Surrogatevariableanalysis)方法分析发现,在癌和癌旁组织间显著差异表达的编码基因共有1,212个,lncRNA共有362个。我们进一步又通过topGO、SPIA(Signalingpathwayimpactanalysis)与GSEA(Genesetenrichmentanalysis)方法分别对编码基因的表达谱进行了GO分析、通路富集分析与基因集富集分析,分别显著富集了42个GO项、5条KEGG通路与231个MsigDB基因项。在这些得到富集的功能项中,急性炎症免疫反应、细胞周期与细胞代谢相关的基因项均有显著统计学意义。此外,我们发现GSEA的结果中包括了来自7项已发表HCC研究的20个基因项,并且其富集的趋势与文献报道一致,提示我们的表达谱数据是可靠的。随后,我们使用GSEA方法对编码基因表达谱与lncRNA表达谱数据进行了整合分析。对362个差异表达的lncRNA的功能富集分析显示,其中的141个lncRNA共富集到了364个基因项。我们利用这一结果构建了lncRNA的功能矩阵,又进一步通过双向聚类的方法最终找到了4个功能模块,共涉及13个lncRNA。在上述4个模块中,有3个模块与细胞周期功能显著相关,剩余一个模块则与细胞代谢功能显著相关。我们通过SPIA方法对上述4个模块进行了进一步的注释,发现在3个与细胞周期相关的模块中还显著富集P53通路。我们还采用GSCA(Genesetco-expressionanalysis)方法证明了4个模块中的基因在我们自己的表达谱数据、GSE22058和GSE3500这三个独立的HCC表达谱数据集中均具有差异共表达模式,因而证明了这4个模块中基因的表达模式具有稳定性。随后,我们下载了ENCODE计划中HepG2细胞系的5种组蛋白甲基化修饰类型的ChIP-Seq数据,用于注释上述4个模块中的13个lncRNA的转录状态。结果显示,在lncRNA-ASLNC18598的启动子区域存在H3K4me1与H3K4me2组蛋白修饰,在其转录区域存在H3K36me3组蛋白修饰,提示ASLNC18598是活跃转录的。随后我们根据密码子替换频率(Codonsubstitutionfrequency,CSF)算法自行开发了CSF++软件,用于lncRNA的蛋白编码能力的预测,结果显示ASLNC18598的编码能力较弱(CSFScore=2.30),提示其是一个真实的lncRNA。GSEA方法的功能预测结果显示,ASLNC18598参与了对细胞周期的调控。同时也与DNA损伤修复(RESPONSE_TO_DNA_DAMAGE_STIMULUS,NES=1.81,FDR=0.040)和TP53通路(TANG_SENESCENCE_TP53_TARGETS_DN,NES=1.80,FDR=0.080)显著相关。近来已有众多研究表明,很多lncRNA可通过表观遗传调控方式发挥作用。因此,为了在我们的数据中发现和鉴定与表观调控相关的lncRNA,我们又制定了一个监督式功能模块图谱的分析策略。经过系列筛选,我们发现了41个与表观遗传调控相关的候选lncRNA。通过检查这些lncRNA的启动子区域与转录区域的组蛋白甲基化修饰、蛋白编码能力以及在GSEA富集分析中的可重复性,我们最终确定了lncRNA-ASLNC18342是一个最优的候选者。在下载自ENCODE计划的ChIP-Seq数据中,我们发现在ASLNC18342的转录区域存在H3K36me3组蛋白修饰;编码能力的预测结果显示,ASLNC18342的编码能力较弱(CSFScore=2.43)。因此,我们可以确定ASLNC18342是一个真实的lncRNA。其功能模块图谱与GSEA分析的结果都表明,ASLNC18342可能参与细胞周期的调控。通过蛋白结合能力的预测,我们发现ASLNC18342可能与MLL(Mixedlineageleukemia)家族的蛋白相互结合,从而介导靶基因启动子区域的H3K4me3组蛋白修饰。本实验室后续功能研究已显示,通过RACE(RapidamplificationofcDNAends)实验,已经证实这两个lncRNA是真实存在的;通过细胞表型实验与小鼠动物模型实验,也已经证实了它们能显著影响细胞周期的进程、显著影响肝癌细胞系的成瘤能力。进一步的分子机制研究也表明,ASLNC18598可以与hnRNP-K蛋白相互结合,从而验证了其与P53相关的预测;ASLNC18342则可与MLL1蛋白相互结合,从而验证了其参与表观遗传调控的预测。综上所述,通过整合分析肝癌组织的lncRNA与编码基因表达谱数据,我们先后筛选出了ASLNC18598与ASLNC18342这两个与细胞周期调控相关的lncRNA,证明了“整合组学”分析不失为一种发现新的肝癌相关lncRNA的强有力的策略。
【作者】陈曦;
【导师】周钢桥;
【作者基本信息】中国人民解放军军事医学科学院,遗传学,2014,博士
【关键词】肝癌;长非编码RNA;细胞周期;表观遗传修饰;

【参考文献】
[1]帅一.交联聚乙烯电缆接头局部放电在线监测与状态评估系统研究[D].华中科技大学,高电压与绝缘技术,2013,硕士.
[2]魏慧静.家庭发展能力测度及其影响因素研究[D].河北大学,人口学,2014,硕士.
[3]刘友生.我国鸭坦布苏病毒分子流行病学研究[D].江西农业大学,预防兽医学,2012,硕士.
[4]娄涛.电力市场辅助服务几个问题的研究[D].清华大学,电气工程,2002,硕士.
[5]李姣军,纪光兵,王培容.基于重用思想的智能型多媒体教学软件模型研究[J].重庆工商大学学报(自然科学版),2004,02:143-146.
[6]张磊.基于作业成本管理的预算管理体系[D].河北大学,会计学,2003,硕士.
[7]潘美玲.社会管理哲学论纲[D].湖南科技大学,马克思主义哲学,2013,硕士.
[8]高昕.人际自立特质对消极情绪刺激反应过程的影响及其机制研究[D].西南大学,基础心理学,2014,硕士.
[9]刘满,井元伟,张嗣瀛.区域极点配置问题的研究方法[J].控制与决策,2005,03:241-245.
[10]李路路.新型固相萃取剂的制备及其痕量元素分离富集应用[D].河南工业大学,2013.
[11]朱新平.自适应侵深弹体头部结构设计与数值模拟研究[D].南京理工大学,机械制造及其自动化,2013,硕士.
[12]蔡立强,徐惠华.攀长钢计检中心加强技术攻关不断提高维护水平[J].冶金自动化,2008,04:70.
[13]代树武,孙辉先.卫星的智能规划与调度[J].控制与决策,2003,02:203-206.
[14]孙增国.基于组合预测方法的国债利率期限结构实证研究[D].东北财经大学,金融学,2012,硕士.
[15]周靖辉.改性的磁性纳米载体负载钯催化一锅法还原胺化反应、缩醛化反应和加氢反应的研究[D].兰州大学,化学工程,2014,硕士.
[16]唐绍春,江涛,潘志超,卢樟锋,方家宏.建筑淤土制备免烧陶粒的可行性研究[J].山西建筑,2014,28:116-117.
[17]徐清华.凌濛初“二拍”中的公案小说文化因素研究[D].西南大学,中国古代文学,2013,硕士.
[18]苗龙.会话含义理论视角下的田纳西·威廉斯戏剧研究[D].济南大学,外国语言学及应用语言学,2012,硕士.
[19]辛晚霞.基于KFCM聚类与GMP追踪算法的图像分割与修复技术研究[D].中北大学,应用数学,2014,硕士.
[20]褚倩倩.我国军工企业集团资本结构优化与最优策略研究[D].山东财经大学,国防经济学,2012,硕士.
[21]孟宪淦.铝-氮/铝太阳吸收涂层发明20周年致辞[J].太阳能.2004(06)
[22]刘鑫淼.马克思技术思想及其当代价值[D].长安大学,马克思主义基本原理,2014,硕士.
[23]恽爽,韩立新,董浚,陈道蓄.KDW综述:基于Web的数据挖掘[J].计算机工程,2003,01:284-286.
[24]蔡康乐.变形Mg-Mn-Sn系合金的显微组织及力学性能的研究[D].太原科技大学,材料物理与化学,2014,硕士.
[25]谢亚鹏.判别分析在上市公司信用风险度量中的应用[D].吉林大学,数量经济学,2004,硕士.
[26]王广华,张丽君,孟凡荣.信息技术在土地管理中的应用[J].国土资源情报,2004,12:1-5.
[27]高彤鼎,高祖民,刘兵.DVB-S传输系统中的视频动态测试[J].广播与电视技术.2004(04)
[28]张天序,洪汉玉,孙向华,宋治.基于估计点扩展函数值的湍流退化图像复原(英文)[J].自动化学报,2003,04:573-581.
[29]毛万里.79例乳腺癌肺转移的危险因素分析[D].大连医科大学,肿瘤学,2012,硕士.
[30]沈慧.中小城市社区管理体制创新研究[D].华中师范大学,社会工作,2013,硕士.
[31]付友涛.反向工程中三维模型重建研究[D].天津大学,计算机应用技术,2004,硕士.
[32]赵连平.牵引变电所综合信息采集系统硬件研究与设计[D].西南交通大学,电力系统及其自动化,2013,硕士.
[33]田东明.联华公司设备管理模式创新研究[D].大连理工大学,机械工程,2003,硕士.
[34]孟晓婉.网络最大流算法与应用研究[D].南京邮电大学,应用数学,2013,硕士.
[35]王小艳.超声微泡提高SelS基因靶向转染2型糖尿病大鼠胸主动脉效率的研究[D].大连医科大学,内科学,2012,硕士.
[36]陈海燕,周俊林.数据清理的实现技术[J].新疆职业大学学报,2004,03:73-74+53.
[37]段小霞.居民的主观感受与CPI统计数据的差异[D].山东大学,金融(专业学位),2013,硕士.
[38]秦超.基于机器视觉的滚针轴承漏针检测系统研究[D].河南科技大学,测试计量技术及仪器,2014,硕士.
[39]王成功.一种二次加压系统节能效果试验研究[D].哈尔滨工业大学,建筑与土木工程,2013,硕士.
[40]林景芳.高中数学研究性学习的探索和实践[D].福建师范大学,教育,2003,硕士.
[41]李佩瑶.出土上古文献的神话传说研究[D].济南大学,中国古代文学,2012,硕士.
[42]吴涵.第二次世界大战期间的西班牙对美外交[D].首都师范大学,世界史,2013,硕士.
[43]朱水媚.中国信用评级标准变化研究[D].上海交通大学,金融,2013,硕士.
[44]马光祖,袁汉章.X射线荧光光谱分析[J].分析试验室.1989(04)
[45]潘丽.谈银行业的数据集中[J].新疆金融,2001,08:42-43.
[46]张郝.谈实践创作中对李可染山水画“墨法”的理解与运用[D].沈阳师范大学,美术,2013,硕士.
[47]陶建芬.江南传统民居室内陈设在现代居住空间中的应用[D].江南大学,设计艺术学,2012,硕士.
[48]李德宁.改进型LTP在人脸识别中的研究与应用[D].哈尔滨理工大学,控制理论与控制工程,2012,硕士.
[49]苑宁思.网络融资模式纾解中小企业融资难[D].天津大学,工商管理,2013,硕士.
[50]李小鸟.集装箱双重运输管理系统研究[D].宁波大学,港航技术与管理工程(专业学位),2014,硕士.

相关推荐
更多